#pipeline de dos niveles

Atención Verificable Eficiente en Comunicación para Inferencia de LLM

Acelera la inferencia de LLM con VeriAttn: atención verificable y eficiente en comunicación, reduciendo carga TEE y mejorando rendimiento hasta 5.42x.

2026-06-16 · 1 min